0
本文作者: 王悅 | 2023-07-20 16:25 |
作者丨王悅
編輯丨董子博
從線下交易轉(zhuǎn)為線上交易的第一步,便是開戶的身份認證。
在菲律賓開通一個貨幣賬戶,到底有多難?來自中國的技術(shù)專家親眼目睹了當?shù)鼐用?,乘坐一個多小時的公交車,來到一個網(wǎng)點,提交一堆紙質(zhì)資料,資料被集中送到一個審核點,再去等待漫長的純?nèi)斯徍恕?/span>
正常情況下,從遞交資料到賬戶開通,整個流程耗時約一個星期,如果用戶量翻倍,人工審核團隊的人數(shù)也要隨之翻倍。
受到人力、門店數(shù)量等限制,開戶認證過程效率低、體驗差,通過率自然非常低,能真正堅持下來完成開通的用戶只有發(fā)起者的3%。
某機構(gòu)一天只能服務(wù)幾十個用戶,等待做身份認證的用戶排到了一年以后。
身份認證專家卻“難證清白”
螞蟻集團安全科技平臺ZOLOZ的李哲認為,只有用數(shù)字技術(shù)做身份認證,才能夠擺脫人力瓶頸,實現(xiàn)高效便捷的開戶體驗,為數(shù)字化發(fā)展提速。
于是他背起行囊,雄心勃勃,準備用自己多年的技術(shù)能力奔赴菲律賓,開啟線上身份認證的“拓荒”之旅。
而現(xiàn)實卻給了這位中國身份認證專家“當頭一棒”。李哲剛到菲律賓,就被機場海關(guān)攔入了“小黑屋”。
原因是,當?shù)貏倓偘l(fā)生一起案件,在逃嫌疑人也叫“LI ZHE”。
簽證信息有限,當?shù)睾jP(guān)沒法確認此“李哲”非彼“LI ZHE”,李哲不得不親自跑去當?shù)匾泼窬郑顚憰娌牧?,當面說明自己不是那個“LI ZHE”,又去當?shù)胤ㄔ?,說明自己沒有犯罪。
兩個機構(gòu)開具的證明要在以后的每次出入境時都隨身攜帶,否則還是會發(fā)生與之前一樣的遭遇。而諷刺的是,李哲前腳剛剛走出移民局大門,一群黃牛就蜂擁而至,追著問:
“假證要不要辦?”
李哲萬萬沒想到,工作還沒展開,就陷入自身難“證”的境地,人肉體驗了一把當?shù)氐纳矸菡J證狀況,他也迅速意識到了問題的嚴峻。
李哲為證明自己不是某某某而填寫的材料
撥開“假證”迷霧,認清“你是你”
019年9月的某天,馬尼拉的雷克托大街上,突然一陣喧嘩嘈雜。
接到線報稱,此處有不法分子正在制造虛假的身份證和駕駛證,菲律賓的警方突擊了當?shù)氐囊粋€假證制造窩點。僅在這一次行動中,工作人員就查獲了342張假駕駛證。
在當?shù)?,制造一本假駕駛證,不法分子就可以獲得1000比索,而一本偽造的菲律賓護照,就能在黑市上買到3500比索。
猖獗的黑產(chǎn)背后,其有恃無恐之處在于當時并不發(fā)達的假證識別技術(shù),這直接鍛造了五花八門的造假手段:對電腦或手機屏幕翻拍并不屬于自己的證件、拍攝打印復(fù)印件、遮擋篡改、高仿定制等。
除了造假手段多樣化之外,近30種證件都被認可為官方證件,卻沒有統(tǒng)一官方庫可以進行信息比對,也給身份認證帶來巨大的障礙。
ZOLOZ想在一帶一路沿線國家和地區(qū),實現(xiàn)的是和中國一樣,用戶全自助、無人工干預(yù)完成金融機構(gòu)的“在線身份認證”,機器遠程識別“你是誰”,以及準確判斷“你是你”,你不是那個被別人冒充的你。
當時品類繁多的菲律賓證件在版面設(shè)計與制證工藝上存在很大差異,主體色彩、底紋樣式、防偽膜、照片、格式與順序、字體樣式等要素各有特點,需要用到OCR技術(shù)識別每一個證件上面的文字信息,從而完成“讓機器識別你是誰”這第一個小目標。
然而,更大的挑戰(zhàn)在于“如何準確判斷你是你”,以應(yīng)對身份篡改、冒用,帶來的欺詐、薅羊毛、洗錢風(fēng)險。
魔高一尺,道高一丈。在圖像識別方面,ZOLOZ算法團隊敏銳地發(fā)現(xiàn)了翻拍證件圖片通常帶有明顯的摩爾紋圖案或者反光特征,并且在一些拍攝角度下,還能觀察到圖片中屏幕邊框,窗口邊框等,采用細粒度識別技術(shù),他們提出了多尺度的證件翻拍檢測算法。
ZOLOZ團隊還發(fā)現(xiàn)了“用打印件冒充真實證件”的檢測突破口,由于兩者材質(zhì)不同,當有平行光射入時,兩者具有不同的漫反射率。因此,他們嘗試改變產(chǎn)品交互,在拍攝證件的瞬間開啟閃光燈,通過“閃光幀”來甄別打印件;此外,通過遮擋區(qū)域邊緣的梯度異常(陰影)和遮擋區(qū)域內(nèi)部的紋理差異信息,來判斷證件是否被遮擋篡改……
結(jié)合這些發(fā)現(xiàn),ZOLOZ探索了一套全球證件防偽算法體系,在2019年,ZOLOZ成為全球首家通過HKMA(香港金融管理局)警署假證測試的企業(yè)。截至目前,相關(guān)技術(shù)已經(jīng)產(chǎn)出相關(guān)專利100余篇。
保護數(shù)據(jù)隱私,讓模型左右手互搏
找到了假證識別的突破口,ZOLOZ團隊又馬上要迎接一個新的命題。
訓(xùn)練數(shù)據(jù)是模型訓(xùn)練、迭代的基礎(chǔ),但可用于模型訓(xùn)練的攻擊樣本數(shù)據(jù)非常少。而團隊基于數(shù)據(jù)隱私保護的準則,對真實數(shù)據(jù)的調(diào)用也極度克制。不同于其他的AI領(lǐng)域,在安全攻防方向上,預(yù)訓(xùn)練階段“不用真實數(shù)據(jù)訓(xùn)練"的理念似乎已在團隊內(nèi)約定俗成。
“如果真要收集足夠的真實樣本再去升級模型,可能還沒升級完,就已經(jīng)被‘打趴下了’。我們要在隱私保護的原則下,找到其他的突破口?!?ZOLOZ 身份安全算法負責(zé)人李哲告訴雷峰網(wǎng)。
于是,ZOLOZ自研了兩套快速生成數(shù)據(jù)的方法,即物理生成和數(shù)字生成。
所謂物理生成,就是模仿黑產(chǎn)的攻擊套路、變換各種姿勢,自己制作可供模型訓(xùn)練的假證樣本。
疫情期間的一個春節(jié),ZOLOZ 團隊的一名工作人員,和他的家人剛剛吃完年夜飯,圍坐在餐桌前。不同于其他人家,新年夜一起包餃子,他們手里剪刀飛舞,把一張張網(wǎng)上下載的圖片打印下來按照一定規(guī)格剪好,再遮擋在證件上,并且拍照留檔。
起初,一張一張剪起來很慢,一家人一個小時只能剪出幾十張。熟練后,一小時能剪出一百多張。
“人家過年都是剪窗花,咱們家過年是剪圖片?!奔胰舜蛉ふf道。
除夕夜發(fā)動全家老小做人工智能訓(xùn)練師的“壯舉”,是為了給 ZOLOZ 制作“篡改遮蓋攻擊”的負樣本,就像金庸小說里的左右手互搏,巨大的3000份攻擊樣本數(shù)量為模型練就了一身硬朗結(jié)實的腱子肉,提升照片遮擋攻擊測試的防御力。
而此舉也幫助ZOLOZ在春節(jié)后的一次競標中,超越競爭對手,贏得了菲律賓當時最大銀行的訂單。
數(shù)字生成,顯然比物理生成更“高級”。ZOLOZ用起了AIGC 批量生成攻擊數(shù)據(jù)樣本,利用生成的樣本同樣可以實現(xiàn)訓(xùn)練模型的結(jié)果,效率更高,效果更逼真。為了增加其生成數(shù)據(jù)的多樣性,ZOLOZ嘗試去更換手機型號,攝像頭類型,屏幕邊框和拍攝環(huán)境等。
此外,借助 Stable Diffusion 模型,能對憑證圖像進行更豐富的拍屏風(fēng)格渲染,也能對現(xiàn)有拍屏模型進行摩爾紋對抗攻擊等。
AIGC 還幫助 ZOLOZ 擴展現(xiàn)有的數(shù)據(jù)特征空間,預(yù)測到更多新型證件材質(zhì)偽造類型,引入更多對抗攻擊樣本來提高模型的防御能力。
這種方式被稱為“冷啟動”,在數(shù)據(jù)隱私保護的前提下,讓模型在小樣本學(xué)習(xí)中迅速上手。
李哲介紹,如今ZOLOZ的通用防偽能力已經(jīng)支持全球十多個國家的上百種證件類型,其中大部分證件的防偽標識可以被識別,并具備防御高仿假證的能力,處于業(yè)界領(lǐng)先的水平。而冷啟動時運用的數(shù)據(jù)幾乎均由AIGC生成,極大地減少了真實數(shù)據(jù)的使用量。而在線上發(fā)現(xiàn)的少量真實的攻擊數(shù)據(jù)成為了模型的測試集,為模型進行調(diào)優(yōu)。
用AIGC打敗AIGC
AIGC 給ZOLOZ帶來了巨大的助力,而 ZOLOZ 也清楚地看到,雖然目前大多數(shù)黑產(chǎn)攻擊仍然采用物理生成的方式,但隨著AIGC技術(shù)的普及,黑產(chǎn)也可能利用AIGC生成更高仿真性和迷惑性的假證,ZOLOZ務(wù)必從現(xiàn)在就開始打磨辨別AIGC的能力。
ZOLOZ給出的應(yīng)對方案是利用自己的AIGC算法,生成大量看起來逼真的證件圖片數(shù)據(jù),用來訓(xùn)練另一個可以識別AIGC的模型。
李哲對AI科技評論表示道:“為了讓訓(xùn)練的模型更加魯棒,在這個過程中還可以加入對抗技術(shù),根據(jù)識別模型在生成數(shù)據(jù)上的表現(xiàn),反過來指導(dǎo)優(yōu)化AIGC算法,再生成更多可以繞過識別模型的樣本,從而不斷增強識別模型的泛化能力?!?/p>
以左手搏右手,以魔法打敗魔法——用AIGC技術(shù),來打敗未來AIGC的風(fēng)險,ZOLOZ 的這條路徑,未來很可能變成安全認證的一大趨勢。
在李哲看來,每道單一的防線也許都不能做到100%完美防御,因此,ZOLOZ不僅僅做圖像識別,還結(jié)合綜合數(shù)據(jù)決策來實現(xiàn)全鏈路的縱深防御策略,從注冊環(huán)節(jié)、到開戶環(huán)節(jié)、再到支付驗證環(huán)節(jié),讓多道防線相互補充,形成相對堅實、可信的身份認證體系。
如今,菲律賓電子錢包Gcash的開戶時間,從原來的一周降到只需要在家操作3分鐘。Gcash的注冊用戶數(shù)超過6600萬,每1.7個菲律賓人就有一位在使用。
疫情期間,ZOLOZ 提供的可信身份認證幫助孟加拉國500萬個家庭實現(xiàn)遠程開戶,當?shù)卣ㄟ^本地最大的移動支付平臺BKash,向失去收入來源的家庭發(fā)放援助金。也因此,ZOLOZ 在2021年獲得了IDC金融科技真實價值獎。BKash CEO卡邁勒·奎德表示:“ZOLOZ 幫助BKash實現(xiàn)了跳躍式發(fā)展,在疫情期間,e-KYC成了我們的救星?!?/p>
截止目前,ZOLOZ已經(jīng)為一帶一路沿線國家和地區(qū)的上百家合作伙伴提供在線身份認證、風(fēng)控決策等技術(shù)支持,覆蓋銀行、保險、證券、電信、公眾服務(wù)等領(lǐng)域。
本文作者:王悅,微信s1060788086。雷峰網(wǎng)(公眾號:雷峰網(wǎng))將持續(xù)關(guān)注AIGC、大模型、數(shù)字人等領(lǐng)域,歡迎添加作者微信,交流行業(yè)信息。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。